Оптимальное парное выравнивание. Алгоритмы.

Параметры глобального и локального выравнивания пары гомологичных белков

Гомологичные белки (homologous proteins, греч. homologos — соответственный, подобный) - белки, имеющие сходную структуру, общее эволюционное происхождение и выполняющие одинаковую функцию у разных видов организмов [1] [2] .
Для выполнения первого задания практикума я выбрала два гомологичных белка из класса цитохромов [3] : CP1A1_RAT и CP1B1_MOUSE, принадлежащих, соответственно, крысе и мыши.
Результаты выравниваний, полученных с помощью программ water(локальное) и needle(глобальное) (пакет EMBOSS), вы можете увидеть в Таблице "Сравнение параметров глобального и локального выравниваний":
Сравнение параметров глобального и локального выравниваний
Тип выравнивания Длина выравнивания Число консервативных позиций (Процент к.п., %) Число функционально консервативных позиций (Процент ф.к.п., %) Число гэпов (Процент г., %) Число инделей
Глобальное 558 208 (37.3%) 310 (55.6%) 49 (8.8%) 13
Локальное 518 205 (39.6%) 304 (58.7%) 21 (4.1%) 9

В Таблице "Сравнение программ глобального и локального выравниваний" указаны характеристики программ needle и water: матрица весов, штрафы за открытие и за удлинение инделя, за концевые гэпы, используемые программой по умолчанию.
Сравнение программ глобального и локального выравниваний
Тип выравнивания Программа Матрица весов Штраф за открытие инделя Штраф за продление инделя Штраф за концевые гэпы
Глобальное needle EBLOSUM62 10.0 0.5 10.0
Локальное water EBLOSUM62 10.0 0.5 10.0
Опираясь на описанные данные мы можем написать комментарий о различиях глобального и локального выравниваний:
~ Длина глобального выравнивания выше длины локального (558 < 518)
~ Число консервативных и функционально консервативных позиций глобального выравнивания выше аналогичных чисел локального выравнивания. Однако из-за значительного различия длин процент консервативных и функционально консервативных позиций выше для локального выравнивания
~ Число гэпов (как и их процент) глобального выравнивания более чем в два раза превышает число гэпов локального.
~ Число инделей глобального выравнивания выше чила инделей локального выравнивания

Рис.1 и Рис.2 иллюстрируют различия между локальным и глобальным выравниваниями.
Рис.1 Глобальное выравнивание
Ссылка на fasta-файл.


Рис.2 Локальное выравнивание
Ссылка на fasta-файл.


При условии пониамания алгоритмов программ needle и water, а также принимая во внимание гомологичность выбранных белков, результат этого исследования становится предсказуем.

Параметры локального выравнивания пары гомологичных белков и пяти пар не гомологичных белков

Для выполнения первого задания практикума я выбрала два гомологичных белка, которые я анализировала в первом задании: CP1A1_RAT и CP1B1_MOUSE. А также еще пять различных белков, принадлежащих мыши (Мus Мusculus (Мouse)):
№1 MEF2C_MOUSE(Миоцит-специфический фактор усиления 2C)
№2 SOX9_MOUSE(Фактор транскрипции SOX-9)
№3 IKZF1_MOUSE(ДНК-связывающий белок Ikaros)
№4 LYN_MOUSE(Тирозин-протеинкиназа Lyn)
№5 FGFR1_MOUSE(Рецептор фактора роста фибробластов 1).
Все эти пять белков негомологичны уже описываемому здесь белку CP1B1_MOUSE (Цитохром P450 1B1).
Ниже приводится видоизмененная Таблица из первого задания, включающая необходимые дополнения. В каждой паре происходит сравнение белка CP1B1_MOUSE (Цитохром P450 1B1, идентификатор - Q64429) либо с гомологичным белком №0 CP1A1_RAT (Цитохром P450 1А1), либо с одним из белков №1-№5
Сравнение локальных выравниваний гомологичных и негомологичных пар
Номер белка и его идентификатор Длина выравнивания Число консервативных позиций (Процент к.п., %) Число функционально консервативных позиций (Процент ф.к.п., %) Число гэпов (Процент г., %) Число инделей
№0 P00185 518 205 (39.6%) 304 (58.7%) 21 (4.1%) 9
№1 Q8CFN5 182 37 (20.3%) 63 (34.5%) 65 (35.7) 9
№2 Q04887 160 31 (19.4%) 47 (29.4%) 63 (39.4%) 7
№3 Q03267 28 8 (28.6%) 14 (50.0%) 0 (0.0%) 0
№4 P25911 94 20 (21.3%) 37 (39.4) 27 (28.7) 5
№5 P16092 85 24 (28.2%) 37 (43.5%) 12 (14.1%) 4
Опираясь на описанные данные мы можем написать комментарий о различиях локальных выравниваний для гомологичных и негомологичных пар белков:
~ Длины выравниваний негомологичных пар намного меньше длин последовательностей
~ Число консервативных и функционально консервативных позиций выравнивания негомологичных пар, относительно аналогичных чисел выравнивания гомологичных, невысоко. Однако из-за короткой длины выравнивания негомологичных пар процент консервативных и функционально консервативных позиций отличается от выравнивания гомологичных пар максимум на 29.3% и минимум на 8.7%. Если говорить о полных длинах последовательностей, то процент значительно падает.
~ Число гэпов (как и их процент) для большинства негомологичных выравниваний значительно превосходит тот же показатель для выравнивания гомологичных пар. Максимальная разница между ними - 35.3%

На Рис.3 - Рис.7 представлены локальные выравнивания негомологичных пар белков:
Рис.3 Локальное негомологичное выравнивание для №1
Ссылка на fasta-файл.


Рис.4 Локальное негомологичное выравнивание для №2
Ссылка на fasta-файл.


Рис.5 Локальное негомологичное выравнивание для №3
Ссылка на fasta-файл.


Рис.6 Локальное негомологичное выравнивание для №4
Ссылка на fasta-файл.


Рис.7 Локальное негомологичное выравнивание для №5
Ссылка на fasta-файл.


Полученые результаты были легко предсказуемы. Пусть и доказано существование негомологичных белков, процент совпадения аминокислот которых может превышать аналогичный показатель некоторых гомологичных, (Гомологичные белки, например, могут сохранять лишь 10 % идентичных аминокислот, а негомологичные — иметь 30 % таковых [4] ) но это скорее исключение, чем правило. Здесь же все белки из негомологичных пар выполняют различные функции, поэтому и отлмчаются так сильно.

Отличия между тремя выравниваниями одних и тех же двух последовательностей, построенные разными программами

В третьем задании я использовала три различных типа выравнивания: множественные выравнивания из практикума 10, з которого были удалены все лишние последовательности, а также глобальные и локальные парные выравнивания. Эти выравнивания были распределены в группы по типам. На Рис.8 можно увидеть эти группы: множественные, глобальные и локальные выравнивания (три группы, представленные двумя последовательностями соответствуют уже названным сверху вниз).
Рис.8 отличия между тремя выравниваниями

Легко заметить, что в локальном парном выравнивании нехватает значительных участков в начале и в конце последовательностей. Поэтому появляется необходимость в сдвиге третьей группы с первой позиции на тридцатую.
В своем большинстве выравнивания совпадают, однако между ними все-таки имеются отличия:
В множественном выравнивании аминокислотные остатки M и S (нижняя из двух последовательностей) стоят на позициях 1 и 2, в то время как в глобальном парном выравнивании они перемещены на позиции 28 и 29. Глобальные и локальные парные полностью идентичны с 30 позиции по 693. Поэтому, все отличия для них с множественными выравниваниями общие. Так, например, в множественном выравнивании аминокислотные остатки A и S (верхняя из последовательностей) стоят на позициях 125 и 126, а в локальных и глобальных парных они сдвинуты на одну вправо и теперь находятся на позициях 126 и 127. Явные отличия в выравниваниях начинаются с 314 позиции. В первой последовательности пары из первой группы (множественные выравнивания) отсутствуют два гэпа, которые мы можем увидеть на позициях 314 и 315 в локальном и глобальном парных выравниваниях. В дальнейшем отличия только растут.

По итогам проведенного исследования наиболее верным мне кажется глобальное парное выравнивание. Оно практически идентично локальному парному выравниванию, с тем отличием, что в нем не удаляются начало и конец (в которых отсутствуют гомологичные участки). Кроме того, оно более полное по сравнению с множественным выравниванием.

Ссылки практикума

[1] - База знаний по биологии человека. Гомологичные белки
[2] - Энциклопедия врача. Многообразие белков
[3] - Википедия. Цитохромы
[4] - Википедия. Гомология (биология). Гомология в сравнительной геномике

© Serebrennikova Maria 2017